7.4 数据概览 EMP_summary
模块EMP_summary可以快速对MAE
对象和EMP
对象进行概览可视化。概览可视化分为以下三个部分:
Data dimention:
Sample
指当前组学项目内实验数据的样本数目,Feature
指当前组学项目内的特征数目。Data information:
Sample_attr
指当前组学项目内样本相关数据的分类数目,Feature_atrr
指当前组学项目内特征相关数据的分类数目。例如,组学项目taxonomy
的Feature_atrr
为8,代表特征注释包括了界门纲目科属种株 8个级别。Data miss:
Assay_status
,Sample_status
和Feature_status
分别指当前组学项目的实验数据、样本相关数据和特征相关数据中是否存在缺失值。
7.4.1 MAE
对象的概览可视化
data(MAE)
MAE |> EMP_summary()
7.4.2 EMP
对象的概览可视化
k1 <- MAE |>
EMP_assay_extract('taxonomy') |>
EMP_collapse(estimate_group = 'Genus',collapse_by = 'row') |>
EMP_diff_analysis(method='DESeq2', .formula = ~Group) |>
EMP_filter(feature_condition = pvalue<0.05)
k2 <- MAE |>
EMP_collapse(experiment = 'untarget_metabol',na_string=c('NA','null','','-'),
estimate_group = 'MS2kegg',method = 'sum',collapse_by = 'row') |>
EMP_diff_analysis(method='DESeq2', .formula = ~Group) |>
EMP_filter(feature_condition = pvalue<0.05 & abs(fold_change) > 1.5)
(k1 + k2) |> EMP_summary()